#!/usr/bin/env python 
# -*- coding:utf-8 -*-
'''
@File    :   string_utils.py    
@Modify Time      @Author    @Version    @Desciption
------------      -------    --------    -----------
2022/4/11 0011 9:18   st      1.0         None
'''

import pkuseg
from utils.constent import pkuseg_model_path

"""
    ----model_name 模型路径。
    "default"，默认参数，表示使用我们预训练好的混合领域模型(仅对pip下载的用户)。
    "news", 使用新闻领域模型。
    "web", 使用网络领域模型。
    "medicine", 使用医药领域模型。
    "tourism", 使用旅游领域模型。
    -----model_path, 从用户指定路径加载模型。
    user_dict		设置用户词典。
    "default", 默认参数，使用我们提供的词典。
    None, 不使用词典。
    dict_path, 在使用默认词典的同时会额外使用用户自定义词典，可以填自己的用户词典的路径，词典格式为一行一个词（如果选择进行词性标注并且已知该词的词性，则在该行写下词和词性，中间用tab字符隔开）。
    -----postag		        是否进行词性分析。
    False, 默认参数，只进行分词，不进行词性标注。
    True, 会在分词的同时进行词性标注。
"""

text = seg.cut('甲状腺功能减退症简称甲减 ，是甲状腺制造的甲状腺激素过少而引发的疾病。')  # 进行分词和词性标注
print(text)
